仅在合成数据上培训的最先进的立体声匹配网络通常无法概括到更具挑战性的真实数据域。在本文中,我们试图展开阻碍网络从跨域推广网络的重要因素:通过快捷学习的镜头。我们证明了立体声匹配网络中的特征表示的学习受合成数据伪影(快捷键属性)的严重影响。为了缓解此问题,我们提出了一种信息 - 理论快捷方式避免〜(ITSA)方法,以自动限制与要素表示的快捷键相关信息。因此,我们的提出方法通过最大限度地减少潜在特征的灵敏度来了解强大而快捷的不变性功能。为避免直接输入灵敏度优化的禁止计算成本,我们提出了一种有效但可行的算法来实现鲁棒性。我们表明,使用这种方法,纯粹对合成数据训练的最先进的立体声匹配网络可以有效地推广到具有挑战性和以前看不见的真实数据场景。重要的是,所提出的方法可以增强合成训练网络的鲁棒性,以至于它们优于他们的微调对应物(在实际数据上)以充分挑战域外立体数据集。
translated by 谷歌翻译
强大的模型拟合是计算机视觉中的一个根本问题:用于在异常值存在下预处理原始数据。共识(MaxCon)的最大化是最受欢迎的强大标准之一和广泛使用。最近(Tennakoon等人CVPR2021),MAXCON之间的连接和单调布尔函数的影响估计。用不同的措施装配布尔维亚级并采用不同的采样策略(同一硬币的两侧)可以具有不同的效果:这导致目前的研究。本文研究了求解MAXCON的加权影响的概念。特别是,我们研究了伯努利测量的布尔立方体,并执行偏置(与均匀)采样进行偏见。从理论上讲,我们证明了在该措施下,属于较大结构的点的加权影响小于属于较小结构的点。我们还考虑了另一个“自然”的采样/加权策略系列,用均匀措施采样,集中在特定(汉明)水平的立方体。基于加权采样,我们修改了Tennakoon等人的算法,并在合成和实时数据集测试。本文不促进新方法本身,而是研究加权抽样问题。因此,我们未声称已经产生了卓越的算法:相反,我们展示了伯努利采样的一些适度增益,并且我们在数据和加权采样中阐明了结构之间的一些相互作用。
translated by 谷歌翻译
胎儿镜检查激光​​光凝是一种广泛采用的方法,用于治疗双胞胎输血综合征(TTTS)。该过程涉及光凝病理吻合术以调节双胞胎之间的血液交换。由于观点有限,胎儿镜的可操作性差,可见性差和照明的可变性,因此该程序尤其具有挑战性。这些挑战可能导致手术时间增加和消融不完全。计算机辅助干预措施(CAI)可以通过识别场景中的关键结构并通过视频马赛克来扩展胎儿镜观景领域,从而为外科医生提供决策支持和背景意识。由于缺乏设计,开发和测试CAI算法的高质量数据,该领域的研究受到了阻碍。通过作为MICCAI2021内窥镜视觉挑战组织的胎儿镜胎盘胎盘分割和注册(FETREG2021)挑战,我们发布了第一个Largescale Multencentre TTTS数据集,用于开发广义和可靠的语义分割和视频摩擦质量algorithms。对于这一挑战,我们发布了一个2060张图像的数据集,该数据集是从18个体内TTTS胎儿镜检查程序和18个简短视频剪辑的船只,工具,胎儿和背景类别的像素通道。七个团队参与了这一挑战,他们的模型性能在一个看不见的测试数据集中评估了658个从6个胎儿镜程序和6个短剪辑的图像的图像。这项挑战为创建通用解决方案提供了用于胎儿镜面场景的理解和摩西式解决方案的机会。在本文中,我们介绍了FETREG2021挑战的发现,以及报告TTTS胎儿镜检查中CAI的详细文献综述。通过这一挑战,它的分析和多中心胎儿镜数据的发布,我们为该领域的未来研究提供了基准。
translated by 谷歌翻译
基于知识的实体预测(KEP)是一项新任务,旨在改善自主系统中的机器感知。KEP在预测潜在的未识别实体方面利用了来自异质来源的关系知识。在本文中,我们将KEP的正式定义作为知识完成任务。然后引入了三种潜在的解决方案,这些解决方案采用了几种机器学习和数据挖掘技术。最后,在来自不同域的两个自主系统上证明了KEP的适用性。即自动驾驶和智能制造。我们认为,在复杂的现实世界系统中,使用KEP将显着改善机器的感知,同时将当前技术推向实现完全自治的一步。
translated by 谷歌翻译